import scrapy


class BdSpider(scrapy.Spider):
    # 爬虫文件名
    name = 'bd'
    # 允许的域名     爬取的网页的路径不在allowed_domains域名之下
    # （爬取的域名和allowed_domains一致或是子域名
    # 那么是不允许爬取的
    allowed_domains = ['www.baidu.com']
    start_urls = ['http://www.baidu.com/']

    def parse(self, response):
        print('运行爬虫文件')
